数据分类算法(1)

您所在的位置:网站首页 ngk 1r代表什么意思我 数据分类算法(1)

数据分类算法(1)

2024-07-16 00:53| 来源: 网络整理| 查看: 265

数据分类算法中,我们遵循“简单高效”,而最简单高效的算法就是1R

什么是1R

1R 就是 1-rule,称为1 规则,也就是产生一层的决策树,用一个规则集的形式,只在某个特定的属性上进行测试。1R是一个简单廉价的方法,但却常常能得到令人吃惊的准确率。

1R 算法

1R是一个非常简单的方法,就是对每一个属性逐个测试并且从中选择一个准确率最高的属性作为决策属性。大致的流程为:

对所有的属性进行遍历 对该属性,按照如下方式产生一条规则 计算每个类别出现的次数 找出最频繁的类别 产生一条规则,将该类别分配给该属性值 计算规则产生的误差 选择误差最小的规则 举例说明

有一组数据

天气数据与是否玩某一种游戏 NO.outlooktemperaturehumiditywindyplay1sunnyhothighfalseno2sunnyhothightrueno3overcasethothighfalseyes4rainymildhighfalseyes5rainycoolnormalfalseyes6rainycoolnormaltrueno7overcasetcoolnormaltrueyes8sunnymildhighfalseno9sunnycoolnormalfalseyes10rainymildnormalfalseyes11sunnymildnormaltrueyes12overcasetmildhightrueyes13overcasethotnormalfalseyes14rainymildhightrueno

根据1R算法则是要对每一个属性进行分析,并产生一条规则,且需要计算误差

对于属性outlook:

sunny总共有5天,其中3天no,两天yes,则sunny应该判定为no。

overcaset 判定为yes

rainy 判定为yes

错误率为4/14

对于属性temperature:

hot yes和no相同,随机为no

mild 为yes

cool 为yes

错误率为5/14

对于属性humidity

high 为no

normal 为yes

错误率为4/14

对于属性windy

false 为 yes

true 随机为no

错误率为5/14

 

四个属性分析后,outlook和humidity中任意选一个。从得出的结论可以看出这个游戏只有在雨天才能进行,晴天好像并不适合。从而得知,也许这是一项室内活动。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3